智能论文笔记

Predicting Treatment Adherence of Tuberculosis Patients at Scale

Mihir Kulkarni , Satvik Golechha , Rishi Raj , Jithin Sreedharan , Ankit Bhardwaj , Santanu Rathod , Bhavin Vadera , Jayakrishna Kurada , Sanjay Mattoo , Rajendra Joshi

分类：机器学习 | 人工智能

2022-11-05

Tuberculosis (TB), an infectious bacterial disease, is a significant cause of death, especially in low-income countries, with an estimated ten million new cases reported globally in $2020$. While TB is treatable, non-adherence to the medication regimen is a significant cause of morbidity and mortality. Thus, proactively identifying patients at risk of dropping off their medication regimen enables corrective measures to mitigate adverse outcomes. Using a proxy measure of extreme non-adherence and a dataset of nearly $700,000$ patients from four states in India, we formulate and solve the machine learning (ML) problem of early prediction of non-adherence based on a custom rank-based metric. We train ML models and evaluate against baselines, achieving a $\sim 100\%$ lift over rule-based baselines and $\sim 214\%$ over a random classifier, taking into account country-wide large-scale future deployment. We deal with various issues in the process, including data quality, high-cardinality categorical data, low target prevalence, distribution shift, variation across cohorts, algorithmic fairness, and the need for robustness and explainability. Our findings indicate that risk stratification of non-adherent patients is a viable, deployable-at-scale ML solution.

translated by 谷歌翻译

DEFT: Diverse Ensembles for Fast Transfer in Reinforcement Learning

Simeon Adebola , Satvik Sharma , Kaushik Shivakumar

分类：机器学习 | 人工智能

2022-09-26

已经证明，深层合奏将典型的集体学习中看到的积极效果扩展到神经网络和增强学习（RL）。但是，要提高此类整体模型的效率仍然有很多事情要做。在这项工作中，我们介绍了在RL（feft）中快速传输的各种合奏，这是一种基于合奏的新方法，用于在高度多模式环境中进行增强学习，并改善了转移到看不见的环境。该算法分为两个主要阶段：合奏成员的培训，以及合成成员的合成（或微调）成员，以在新环境中起作用。该算法的第一阶段涉及并行培训常规的政策梯度或参与者 - 批评者，但增加了鼓励这些政策彼此不同的损失。这会导致单个单峰剂探索最佳策略的空间，并捕获与单个参与者相比，捕获环境的多模式的更多。 DEFT的第二阶段涉及将组件策略综合为新的策略，该策略以两种方式之一在修改的环境中效果很好。为了评估DEFT的性能，我们从近端策略优化（PPO）算法的基本版本开始，并通过faft的修改将其扩展。我们的结果表明，预处理阶段可有效地在多模式环境中产生各种策略。除了替代方案，faft通常会收敛到高奖励的速度要快得多，例如随机初始化而无需faft和合奏成员的微调。虽然当然还有更多的工作来分析理论上的熟练并将其扩展为更强大，但我们认为，它为在环境中捕获多模式的框架提供了一个强大的框架，同时仍将使用简单策略表示的RL方法。

translated by 谷歌翻译

Automated Pruning of Polyculture Plants

Mark Presten , Rishi Parikh , Shrey Aeron , Sandeep Mukherjee , Simeon Adebola , Satvik Sharma , Mark Theis , Walter Teitelbaum , Ken Goldberg

分类：机器人 | 人工智能

2022-08-22

多养殖养殖具有环境优势，但比单一养殖需要更修剪。我们介绍用于自动修剪的新型硬件和算法。自主系统使用高架摄像头从物理规模的花园测试床中收集数据，利用学识渊博的植物表型卷积神经网络和边界磁盘跟踪算法来评估单个植物分布并每天估算花园的状态。从这个花园状态下，Alphagardensim选择植物自主修剪。训练有素的神经网络检测并靶向工厂上的特定修发点。实验评估了两种与农业机器人龙门系统兼容的定制设计的修剪工具，并通过受控算法进行了自主削减。我们提出了四个60天的花园周期的结果。结果表明，该系统可以自主实现0.94个归一化的植物多样性，并在修剪剪切的同时保持平均冠层覆盖率为0.84，到周期结束时。有关代码，视频和数据集，请参见https：//sites.google.com/berkeley.edu/pruningpolyculture。

translated by 谷歌翻译

Effective Gesture Based Framework for Capturing User Input

Pabbathi Sri Charan , Saksham Gupta , Satvik Agrawal , Gadupudi Sahithi Sindhu

分类：人工智能

2022-08-01

当今的计算机不仅限于笔记本电脑和台式机。手机和笔记本电脑等移动小工具也可以利用它。但是，在过去50年中没有更改的一个输入设备是QWERTY键盘。通过传感器技术和人工智能，虚拟键盘用户可以在任何表面上输入任何表面。在这项研究中，我们使用图像处理的想法来创建一个应用程序，以使用新颖的框架来查看计算机键盘，该框架可以精确地检测手势，同时也具有可持续性且在财务上可行。相机用于捕获键盘图像和手指动作，后来充当虚拟键盘。此外，本研究还描述了一种接受手指坐标为输入的可见虚拟小鼠。该系统具有降低外围成本的直接好处，减少由于外部设备而产生的电子废物，并为无法使用传统键盘和鼠标的人们提供可访问性。

translated by 谷歌翻译

Learning Switching Criteria for Sim2Real Transfer of Robotic Fabric Manipulation Policies

Satvik Sharma , Ellen Novoseller , Vainavi Viswanath , Zaynah Javed , Rishi Parikh , Ryan Hoque , Ashwin Balakrishna , Daniel S. Brown , Ken Goldberg

分类：机器人

2022-07-02

模拟到现实的转移已成为一种流行且非常成功的方法，用于培训各种任务的机器人控制政策。但是，确定在模拟中训练的政策何时准备将其转移到物理世界通常是一个挑战。部署经过很少的模拟数据训练的策略可能会导致物理硬件的不可靠和危险行为。另一方面，模拟中的过度训练会导致策略过度拟合模拟器的视觉外观和动力学。在这项工作中，我们研究了自动确定在模拟中训练的策略何时可以可靠地转移到物理机器人的策略。我们在机器人织物操纵的背景下专门研究了这些思想，因为成功建模织物的动力学和视觉外观的困难，成功的SIM2Real转移尤其具有挑战性。导致织物平滑任务表明我们的切换标准与实际的性能很好地相关。特别是，我们基于信心的切换标准在培训总预算的55-60％之内达到了87.2-93.7％的平均最终面料覆盖率。有关代码和补充材料，请参见https://tinyurl.com/lsc-case。

translated by 谷歌翻译

Fleet-DAgger: Interactive Robot Fleet Learning with Scalable Human Supervision

Ryan Hoque , Lawrence Yunliang Chen , Satvik Sharma , Karthik Dharmarajan , Brijen Thananjeyan , Pieter Abbeel , Ken Goldberg

分类：机器人 | 人工智能

2022-06-29

机器人舰队的商业和工业部署在处决期间通常会落在遥远的人类遥控者身上，当时机器人处于危险之中或无法取得任务进展。通过持续学习，随着时间的推移，从偏远人类的干预措施也可以用来改善机器人机队控制政策。一个核心问题是如何有效地将人类关注分配给单个机器人。先前的工作在单机器人的单人类设置中解决了这一点。我们正式化了交互式车队学习（IFL）设置，其中多个机器人可以交互查询并向多个人类主管学习。我们提出了一个完全实施的开源IFL基准套件，以评估IFL算法的GPU加速ISAAC健身环境。我们提出了Fleet-Dagger，这是一个IFL算法的家庭，并将一种新颖的Fleet Dagger算法与模拟中的4个基准进行了比较。我们还使用4个ABB Yumi机器人臂进行了1000个物理块式实验试验。实验表明，人类向机器人的分配显着影响机器人车队的性能，并且我们的算法比基线的算法获得了人类努力回报的8.8倍。有关代码，视频和补充材料，请参见https://tinyurl.com/fleet-dagger。

translated by 谷歌翻译

Generative Pretraining for Black-Box Optimization

Siddarth Krishnamoorthy , Satvik Mehul Mashkaria , Aditya Grover

分类：机器学习 | 人工智能

2022-06-22

科学和工程中的许多问题涉及在高维空间上优化昂贵的黑盒功能。对于此类黑盒优化（BBO）问题，我们通常会为在线功能评估进行少量预算，但通常也可以访问固定的离线数据集进行预读。先前的方法试图利用离线数据来近似函数或逆向，但与数据分布相距不足。我们提出了Black-Box优化变压器（Boomer），这是一种使用离线数据集预处理黑框优化器的生成框架。在Boomer中，我们训练自回归模型，以模仿隐式黑框功能优化器的轨迹运行。由于默认情况下这些轨迹不可用，因此我们通过从离线数据中对随机点进行排序来开发一个简单的随机启发式，以合成轨迹。从理论上讲，我们表明这种启发式诱导的轨迹，这些轨迹模仿了从不同的低保真度（探索）到高保真（剥削）样本的过渡。此外，我们引入了机制，以控制从勘探到剥削的轨迹过渡的速率，并在测试时间内将其推广到离线数据之外。从经验上讲，我们使用随便的蒙面变压器实例化繁荣，并在设计基础上进行评估，在设计基础上，我们平均排名最优于最优于最先进的基线。

translated by 谷歌翻译

Word Embeddings for Automatic Equalization in Audio Mixing

Satvik Venkatesh , David Moffat , Eduardo Reck Miranda

分类：机器学习

2022-02-17

近年来，机器学习已被广泛采用以自动化音频混合过程。自动混合系统已应用于各种音频效应，例如增益调整，均衡和混响。可以通过视觉接口来控制这些系统，使用旋钮和语义描述符提供音频示例。使用语义描述符或文本信息来控制这些系统是艺术家传达其创意目标的有效方法。在本文中，我们探讨了使用单词嵌入代表语义描述符的新颖想法。通常通过在大型书面文本中培训神经网络来获得单词嵌入。这些嵌入是神经网络的输入层，以创建从单词到eq设置的翻译。使用此技术，机器学习模型还可以生成以前从未见过的语义描述符的EQ设置。我们将人类的EQ设置与神经网络的预测进行比较，以评估预测的质量。结果表明，嵌入层使神经网络能够了解语义描述符。我们观察到，具有嵌入层的模型的性能要比没有嵌入层的模型更好，但仍然不如人类标签。

translated by 谷歌翻译

AlphaGarden: Learning to Autonomously Tend a Polyculture Garden

Mark Presten , Yahav Avigal , Mark Theis , Satvik Sharma , Rishi Parikh , Shrey Aeron , Sandeep Mukherjee , Sebastian Oehme , Simeon Adebola , Walter Teitelbaum

分类：机器人 | 人工智能

2021-11-11

本文展示了alphaRARDEN：一个自治的多种植花园，在1.5米×3.0米的物理测试平台中撒上和灌溉生物植物。alphanArden使用架空相机和传感器来跟踪植物分布和土壤水分。我们模拟个体植物生长和平面动态，以培训选择行动以最大化叶片覆盖和多样性的政策。对于自主修剪，alphanarden使用两个定制的修剪工具和训练有素的神经网络来检测紫杉角。我们为四个60天的花园周期提供了结果。结果表明，alphaRARARDEN可以自主地实现0.96个归一化多样性，在循环峰值期间保持0.86的平均冠层覆盖率。可以在https://github.com/berkeleyautomation/alpharden找到代码，数据集和补充材料。

translated by 谷歌翻译

You Only Hear Once: A YOLO-like Algorithm for Audio Segmentation and Sound Event Detection

Satvik Venkatesh , David Moffat , Eduardo Reck Miranda

分类：机器学习

2021-09-01

音频分割和声音事件检测是机器聆听中的关键主题，旨在检测声学类别及其各自的边界。它对于音频分析，语音识别，音频索引和音乐信息检索非常有用。近年来，大多数研究文章都采用分类。该技术将音频分为小帧，并在这些帧上单独执行分类。在本文中，我们提出了一种新颖的方法，叫您只听一次（Yoho），该方法受到计算机视觉中普遍采用的Yolo算法的启发。我们将声学边界的检测转换为回归问题，而不是基于框架的分类。这是通过具有单独的输出神经元来检测音频类的存在并预测其起点和终点来完成的。与最先进的卷积复发性神经网络相比，Yoho的F量的相对改善范围从多个数据集中的1％到6％不等，以进行音频分段和声音事件检测。由于Yoho的输出更端到端，并且可以预测的神经元更少，因此推理速度的速度至少比逐个分类快6倍。另外，由于这种方法可以直接预测声学边界，因此后处理和平滑速度约为7倍。

translated by 谷歌翻译